【万字长文】HealthX Talk 董恩盛:约翰霍普金斯新冠疫情地图的建成、挑战和未来
点击上一篇活动回顾文章,了解更多HealthX Talk#002的内容。
【活动回顾】HealthX Talk #002 董恩盛:约翰霍普金斯大学新冠疫情地图
北京时间2021年2月28日周日早晨, 在HealthX俱乐部线上举行的第二期HealthX Talk中,董恩盛博士热情澎湃的分享了关于约翰霍普金斯新冠疫情地图(JHU Covid-19 Dashboard)的制作过程,以及作为一位二年级博士生在约翰霍普金斯大学“掌舵”这一历史伟大工程项目的心得体会。本文详细总结了活动的重点内容,以及参与讨论的教授们和小伙伴们的精彩点评互动。
首先,在分享董恩盛博士疫情地图的技术细节之前,HealthX Club想着重强调一点,新冠肺炎COVID-19是人类历史上的一场巨大的浩劫。自2019年12月以来,新冠肺炎COVID-19肆虐全球已超过一年时间。截止2021年4月5日,全球超过一亿三千万人感染新冠肺炎, 死亡人数超过两百八十五万,造成了不可估量的巨大生命经济损失,同时也给全人类造成了巨大的心理创伤。引用世界卫生组织总干事谭德赛的一句话 “We must remember that these are people, not numbers.” 我们必须要记住, 这些是人,不是数字。
世界卫生组织WHO2020年1月31日的Twitter:“我们必须要记住, 这些是人,不是数字”
而在我们每个人都亲身经历的这场人类浩劫中,令人感同身受的是疫情信息快速更新的重要性。突如其来的这场新冠疫情使世界很多国家和地区因为公共卫生数据平台建设的不足而乱了手脚,各国的疫情信息也变成了嘈杂的数据孤岛。如何从全球的视角,及时准确的记录新冠疫情的发展是一个前所未有的工程挑战,更是新冠疫情时代最直接的人文关怀。秉承立足当下、经世致用的学术愿景,公共卫生文献中的种种疾病统计预测模型如果缺少了准确的数据来做支撑,也很难有用武之地。因此大规模而精准的疫情数据收集成了对新冠肺炎数据进行研究的重要前提。得益于约翰霍普金斯大学的疫情地图平台,很多问题得到了进一步解答。比如JHU疫情地图网站上Critical Trends(关键趋势)上列举的这些问题
以及作为经历这场人类浩劫的普通人,我们也好奇
过去一年多时间里,全球每天有多少人感染?多少人死亡?
哪些地方感染和死亡的人数最多?新冠疫情增长的速度最快?
具体到每个省、市、州、郡、县等各国行政单位上又有多少人感染?
某个城市比如西雅图新冠疫情最近一周的趋势如何?什么时候可以“flatten the curve”(增长放缓趋平)?
目前随着疫苗接种的普及,哪些地方接种的人数最多,接种的趋势和什么因素相关?
新冠肺炎的感染在时间和空间上是否呈现统计学趋势?而新冠肺炎传播的潜在数学模型是什么?
等等。
带着对这些问题的好奇,我们邀请全球最具影响力疫情地图 JHU Covid-19 Dashboard的架构师、John Hopkins Bloomberg公共卫生学院的博士生董恩盛做客HealthX Club,和来自中美公共卫生领域的资深教授们还有医疗科技行业的伙伴们一起聊聊全球最具影响力新冠疫情地图背后的故事。
1. 董恩盛介绍
董恩盛是约翰斯·霍普金斯大学土木与系统工程系博士生,师从Lauren Gardner教授,研究方向是疾病模型,是约翰·霍普金斯大学疫情地图架构师。董博士此前接受过人民日报、新华社、科学杂志(Science)、自然杂志(Nature Index)、华尔街日报(Wall Street Journal)、华盛顿邮报(Washington Post)等主流媒体的采访。董恩盛博士导师Lauren Gardner和习主席、钟南山院士、福奇教授荣登《时代周刊》2020全球最具影响力百人榜。
2. HealthX Club介绍
HealthX Club 于2021年1月由两位毕业于卡耐基梅隆大学和哈佛大学的数据科学家成立。我们志在探索前沿科技对健康医疗行业的颠覆性革命,从工程、产品、学术多维度挖掘、发现新一代医疗科技公司和团队。自成立以来,俱乐部每月不定期组织线上/线下的分享活动,为更多思维碰撞提供可能。2021辛丑牛年伊始,HealthX医疗科技俱乐部迅速扩张,现已聚集众多世界著名大学研究机构的的科学家(如哈佛、麻省理工、清华、北大、斯坦福、剑桥、耶鲁、卡耐基梅隆、MD Anderson癌症研究中心、伯克利、上海交通大学、UIUC、加州理工等),医疗科技公司的设计、研发、数据、产品专家(如药明康德、Benevolent AI、晶泰科技、PathAI、BrainCo、Prudential Financial、赛默飞世尔、阿斯利康、腾讯健康、Rally Health、 Oscar Health、微软、Facebook、NVIDIA、Petuum等),和专注医疗科技创新领域的企业家、创始人和投资人。我们期待更多志同道合的前辈和伙伴们加入交流!
3. 约翰霍普金斯新冠疫情地图介绍
董博士首先播放了一段美国总统拜登在美国疫情死亡人数超过50万的时候发表的白宫讲话,而拜登提到的美国累计死亡人数500071,正来自于约翰霍普金斯新冠疫情地图JHU COVID-19 Dashboard(之后简称Dashboard)。CBS This Morning的主持人也介绍了该节目依赖于Dashboard来为每天早上的新闻节目提供疫情数据更新。可见JHU Dashboard在美国主流社会中的重要程度。
美国总统拜登在白宫讲话中引用JHU COVID-19 Dashboard数据
CBS This Morning介绍JHU COVID-19 Dashboard
而其他各国主流媒体,比如新华社、新闻联播中报道美国疫情时经常提到的“美国约翰霍普金斯大学实时统计数据” 也同样来自JHU COVID-19 Dashboard。
2021年4月6日新闻联播内容
首先让我们从产品的角度来看一下Dashboard(仪表盘)的构成。
最主要的就是dashboard中间这些红色的点所组成的地图。每个点代表当地所有的确诊病例,点越大,当然代表病例越多。但是每个点所代表的范围是不一样的,比如说在美国每一个点代表一个county level/郡县的水平。其他国家比如说英国、澳大利亚,加拿大、俄罗斯、巴西这些国家一个点是相当于一个state或者province level,州或者省的一个级别的精细度,而在中国我们也是精确到省级单位。 在dashboard左右两侧可以看到一些统计数据,左边和右边可以看到各个国家总感染人数,总死亡人数的列表。还有美国一些比较专门的数据,比如说美国的每一个州和郡县的死亡和确诊病例,而且还有美国各地的testing rate,检测率。接下来董博士团队还会添加美国各地的疫苗接种数据。 Dashboard右下角是6种Epi Curve流行曲线,包括每日感染人数曲线、每日死亡人数曲线、累计感染人数曲线、累计死亡人数曲线、Log对数曲线。这些epi curve对于公共卫生研究者及政策制定官员是必须的。 Dashboard中间红框中的部分还可以切换另四种不同的地图模式。Active Case(现存病理图)、Incidence Rate (患病率)、Case-Fatality Ratio(确证病例中的死亡率)、Testing Rate(检测率)。
Dashboard上线的时间点也非常值得一提,2020年1月21日美国出现第一例新冠肺炎患者,第二天1月22日,JHU COVID-19 Dashboard上线,随后几个小时武汉封城。Dashboard在疫情全球大范围传播的早期上线,意味着其追踪到了全球疫情演变的全过程。
4. Dashboard创作过程
据董博士介绍,疫情地图起源于2020年1月21日他与导师一起喝咖啡时的一次讨论。1月21号,当时是我和我的老师Lauren Gardner在讨论下一学期要做些什么,她知道我也在非常关注新冠肺炎的发展,然后天天看国内的新闻,也是铺天盖地都是这方面的消息。我当时就觉得国外为什么没有相关的一个新闻源,或者说国家卫生部门,比如中国的CDC每天公布很具体的感染死亡人数的数据,但是在西方的媒体上面并没有看到一个很有条理的一个整理,我就觉得我们是不是也需要做一些数据方面的收集。
而当时我也正好加入了Gardner教授的组,我们主要研究是疾病的 mobility,就是探索挖掘一个疾病空间传播的规律。我立刻就觉得直接研究新冠肺炎相当于一个千载难逢的机会。而且当时我也不觉得这个病会持续很长时间,有可能就像地SARS一样,估计一个学期左右就可以很好的被各国政府控制下来,我就觉得可以当做我一个人的小project去做。
而且当时还有一个想法,之前我们在搜集一些关于美国麻疹案例的一些病例的时候,我们觉得美国虽然说数据都公开,但是数据公开的精细程度确实有待商量,因为如果只是公开到州一级的数据的话,对于学术研究说实话意义并不是特别大,所以说这也就给了我一个想法就是说与其等到要研究疾病传播的时候,再想办法去一个个郡县的去收集COVID Case,何不从一开始就收集郡县的一些数据,这样以后对我自己的一些论文会有帮助。所以当时开小组会的时候,我老板就说要不要做个dashboard,我当时就非常开心,一拍即合。当天我就回到办公室,大概花了八九个小时就做了初版的dashboard。
然后1月22号早晨我发给我导师,然后他给我提供了一些专业方面的建议,比如说适合展示什么样的数据,哪些有流行病学意义等。给了我这些建议之后,她就在推特上面发布了这则消息。这也是迄今为止我们中心发布的唯一一条关于dashboard的“广告”。
2020年1月21日,董博士一夜奋战做出Dashboard原型,随后Lauren Gardner教授Twitter分享,Dashboard在学术圈中被广泛转载,并逐渐被研究机构(JHU)、学术期刊(柳叶刀传染疾病)、主流新闻媒体关注。短暂的几个月中,从1月22号我们发布之后直到4月中旬的一个使用量。Dashboard最高峰的时候,3月31日的日访问量可以达到45亿的访问量,相当于在那一天,全球77亿6千万人中三分之二的人点击了Dashboard一次。截止2021年2月1日,Dashboard总访问量超过2000亿,超过了很多主流媒体的访问量。
除了巨大的访问量,Dashboard的权威可靠性也被广泛认可,美国卫生部、德国政府、意大利内阁等政府部门直接参考约翰霍普金斯疫情地图。权威媒体和学术杂志如NPR、Nature Index、纽约时报、华尔街日报等详细报道了疫情地图。董博士介绍,其中比较有意思的是Wall Street Journal,他用historic first来描述我们的dashboard。其实我之前也问过我的导师,我说我们的 dashboard创新点在哪里?对于我来说,其实我就觉得只是一个收集数据,然后进行一个展示,感觉创新并没有那么多,但是我的老师告诉我创新点在于让全世界可以实时的观看的、一个很dynamic的疫情的动态发展,而在人类历史上是从来没有过的。
JHU Dashboard令人一目了然的设计语言也被各机构广泛模仿,有兴趣的朋友可以自行搜索这些机构做的Dashboard,看看和约翰霍普金斯的初代Dashboard像不像😄:WHO、日本、香港、澳门、中国CDC、意大利、新加坡、泰国、以色列、菲律宾、韩国。我们可以看到Dashboard的设计深入人心,也间接的推动了全世界疫情数据公开。
5. 数据!数据!数据!疫情地图中的数据处理流程、数据分享策略及合作
董博士表示,Dashboard做的再漂亮,也不及数据的重要性。因为数据才是我们做这个项目核心,我们为了确保数据是及时和准确的,也做了非常多的工作。
最开始,我们每一天的数据通过人工的进行核实,在最早的1月份和2月初,基本上是我一个人手动的在更新数据。之后JHU公共卫生学院的一些小组陆续加进来,然后每天我让他们填一张Google Sheet的表格,包括记录日期、检查的时间、记录者姓名、国家地区、感染数据、数据源等。如果哪个数据源出现问题,我们可以第一时间去查看这个数据到底对不对,并进行一些及时的公正。
但是这种手动的方式很快遇到了瓶颈,大家知道美国有3000多个County郡县,如果要每一个郡都去手动实时更新的追踪,完全是不可能的,所以说我们必须依托计算机自动化,设计一个data platform数据自动处理的流程。分为以下几个步骤。
首先我们就把全世界权威的一些数据网站把他们的数据爬虫抓取下来。但其中有很多数据嘈杂的问题,因为这些网站格式都是千奇百怪的,没有统一的格式。比如说美国CDC报告的每天都是一条新闻,然后并没有形成一个表格,让你很方便的去把数据抓取下来,我们需要解决这样的难题。有些地方很奇葩,只在Facebook或者Twitter上面进行报告,这样也让我们很抓狂。即便你有人工智能,但是怎么能确定这条疫情发布的消息是官方的,或者确定消息里报告的感染人数是非常及时的,还有如何确定官方消息和其他渠道报告的消息没有相互的冲突,等等。还有有一些地方他们用PDF,甚至还有用 PowerPoint进行报告的,然后这也让我们的整个数据的收集过程非常艰难的。
Dashboard部分数据源,来自Dashboard Github
第二是我们要把所有数据汇总,并进行标准化,也就是说每个地方报告的数据要翻译汇总都要变成统一的Confirmed Cases(确诊病例),这是一个非常花费时间的过程,有自动的统计方法,但很多时候更需要人工的检查。
汇总的数据会按照时间记录在GitHub平台,(截止于4月6日该repo有26K Stars, 16.7K Fork,董博士介绍,GitHub CEO评论说惊呆了!Amazing!一行code都没有居然这么多star)。
之后基于Github我们会把数据分布到不同的渠道进行展示,比如我们的Dashboard,这是基于Esri平台做的(注:Esri是美国1969年成立的老牌地理信息学技术公司)。还有就是每过一个时间单位,take a snapshot,给数据截个图,比如汇总一下当日新增死亡人数。新闻媒体记者及公共卫生学者会引用这样的数据。Google Maps也有一个COVID-19 Layer用的就是JHU Dashboard的数据。
我们的团队也做了很多人工核实的工作,比如我们有一个公开的Gmail邮箱每天会收到各个国家不同人的一些报告。比如说在去年2月份,意大利有一些疫情的情况,当地人通过邮箱告诉我们。然后我们发现确实这是一个case,但是其他尤其是英文世界的媒体并没有报道,所以说我们就率先报道了。这样一个和用户之间的良性的沟通,也使得我们的dashboard报告的非常的及时。
大家如果对新冠肺炎时序数据处理感兴趣,可以研究一下github里这个folder。董博士推荐使用csse_covid_19_time_series文件夹,HealthX Club之后也会有一个基于新冠时间序列分析的HealthX Code分享。
6. 挑战和解决方案
设计上的很多不同选择,比如地图上点的大小、点的颜色、点的层次、地点等等。而其中有意思的一点是,如何表示感染人数,是用Polygon还是用Dot,大家觉得如果是你设计应该用什么呢?还有就是用点的大小来表示人数,还是用颜色的深浅?董博士团队选择用点主要是因为给人视觉上一个直观的冲击,让人知道疫情确实比较严重,需要行动起来。
Dashboard涉及非常多不同时区地点快速更新的数据源,如何确保数据的准确可靠。感兴趣的朋友可以参考董博士于去年二月发表在柳叶刀Infectious Diseases上的文章(截止至2021年四月,Google Scholar上已有超过3900次引用)董博士在Talk中详细比较了JHU Dashboard和WHO, 美国其他疫情数据平台如USA Facts,New York Times, 美国大西洋周刊COVID-Tracker的区别。JHU Dashboard在公开、及时、系统性纠错回顾能力上比其他数据平台更胜一筹,所以JHU Dashboard成为目前最可靠的新冠数据发布平台和时代周刊2020年最伟大的发明之一。董博士也提到了法国公布数据因为其奇葩的分类方式造成了和其他地区横向比较时标准化不能统一的问题。令人反思疫情之后,各国发布流行病学数据的格式能否建立一个统一的标准。
董博士柳叶刀文章
董博士Google Scholar关于COVID-19的文章
Dashboard右下角每日新增数据Epi Curve上有一个值得注意的spike。这个突然增加的数据来自土耳其。可以看到土耳其2020年12月9号的时候数据一下从55万一下涨到涨到了174万之多,然后也没有官方也没有很合理的解释。如果同样的情况发生在美国的话,比如很多地方会有可能当天会报道一个spike,但是我们之后会把这样一个数据平均的分摊到之前的每一天,相当于做一个回溯,这样的话可以把凸出来的这一部分数据放到我们之前的每一天当中,对在数据上建模也是比较有帮助的。大家如果在土耳其认识人,可以联系我们,帮助董博士把这个spike去除😂。
什么时候更新数据?我们的地图是从全世界各个官方渠道获得的数据,这样内部的一个scarper是每30分钟更新一次,我们的dashboard是每一个小时更新一次,GitHub的数据的话是每一天进行一次公布。所以根据实际的要求和情况,比如像CNN他们需要时时刻刻去更新数据,他们就可以通过跟我们联系,我们会给他一个API,他们就可以得到实时的数据。或者说如果只是学术研究,可能只需要moving average的话,就可以直接用GitHub已经发布好的time series的数据。另一个大挑战在于时差,全球这么多地区、到底以什么时间节点为准?JHU Dashboard能做到1小时更新一次确实非常了不起。
还有一些比较比较值得探讨的因素是隐私,国内我们都是使用健康码,可以实时跟踪每一个案例,和人口的流动状况。但是同样的事情在西方世界就比较困难。最简单的一个例子就是当钻石公主号的一些美国人从日本撤回美国本土的时候,每个人其实当时都是分散在美国不同的军事基地或者一些医院里面。我们当时是可以追踪每一个具体病例到底是在哪里,但是如果你要把这些点报告在地图上面,其实也就相当于变相的告诉全世界这些人在哪里隔离,有心人是很容易搜到这个人到底是谁。所以为了个人隐私一种保护,我们当初就做了一个决定,就是把这些所有的撤侨移给到一个点上面。可是问题又来了,这个点放在哪里?我们一开始想法就是放到美国的几何地理中心上面,在 Kansas的某一个地方,并没有多大意义,只是因为它是在美国几何在地理中心上面。但是放这个点的第二天,当地的居民不乐意了,说为什么我的公寓上面有一个红色的点,我这并没有COVID-19,他就很很生气,然后就给我们学校打电话,甚至还给白宫举报,最后没办法,就把这个点然后又放回日本了。虽然说实际上这些点所代表的这些病患并不在日本,但是出于某些隐私的考量,我们不得不又把它放回日本,后面我们也采用一些技术上的跟进,可以让点在地图上显示不出来,但是后续统计数据当中会包括。
7. 后疫情时代全球公共卫生数据平台展望
最后是我们对于未来全球公共卫生数据平台建设的一些建议。我们收集了很久的数据,在全世界各个国家,美国不同州,美国同一个州不同郡县之间报告数据的方式,都是非常差异化。因此我们希望全世界可以建立一个比较统一的系统,这样的话如果以后再出现类似的情况,并不至于手足无措,或者说并不像WHO或者是美国政府某些时候存在的一些延迟的报道。在董博士团队这篇发表于柳叶刀Infectious Disease杂志上的文章A need for open public data standards and sharing in light of COVID-19中,提出了几点建议
比如说我们对于新冠数据,要进行一个明确的定义,什么叫确诊病例,什么叫疑似病例?如果要在不清楚的情况下,我们又该如何处理?
然后还有我们希望在每一次数据发布的时候,都是采用一个可以网络抓取的一种格式,而不是上传什么PDF、Tableau或者PowerPoint这些。说是公开了,但是用处并不是特别大。
还有一些隐私,标准化的问题,我们在这篇文章做了一些初步的探讨。
董博士团队成员,2020年 7月份的时候得了一个Making a difference award,董博士导师Gardner教授得到了时代周刊年度一百人物称号。
最后请大家扫码捐款JHU COVID-19 Dashboard!!!
8.圆桌讨论精彩内容
HealthX Club创始两位创始人
非常感谢董博士,我们未来的董教授来分享 covid-19 dashboard背后的故事,也让我们了解到在这个过程中,董博士的团队真的是以非常严谨认真的学术精神,不遗余力的要把这个dashboard做到极致,我们觉得是英雄的学者,更是我辈楷模。Covid-19 dashboard,我们众所周知也为全国的全球的一抗议工作提供了非常大的支持,我觉得必将名垂青史。
北京大学宁毅教授
我基本上每一次在对外讲新冠疫情的前一天或者是前一个小时,都会update一些信息,主要是根据霍普金斯所呈现的全球的数据以及各个国家的数据,在这里还是特别感谢董博士团队给我们提供了一个特别好的线索。那么从地图的产生一直到疫情的进展的过程中,我和南美和欧洲包括我们很多的一些大使馆或者国际组织交流的过程中,基本上我们都是按照霍普金斯地图上给出的数据做出了一些的预判。基本上,我们根据霍普金斯地图数据做出的预判还是非常准确的。
还有就是我觉得我们念书的时候做博士或者说做大学教授的时候,应该想我们的创新点是什么。前两天我听到了一个思路,就是第一步是科学,第二步是一个技术的转化,再到一个工程。我觉得董博士团队真是非常了不起,他是从一个科学转化一直到一个巨大的工程,这里实现了人类对疫情的一个非常直观的看法,非常了不起的。因为不单是我们专业人士看数字,普通人看这些疫情数字的时候,就能知道这个世界的疫情的变化,甚至能影响到我们自身应该做什么?我觉得从学者的角度也好,或者是从工程或者从社会影响等多个角度来说,约翰霍普金斯呈现了我们整个公共卫生领域对整个世界的贡献,真是不非常了不起的,刚才新月说会名垂青史,我觉得确实是这个样子,会是一个人类很了不起的一个工程。
做JHU COVID-19 Dashboard这项工程的时候,实际上董博士团队已经走到了一个非常前沿的位置。比如说我们说大数据的时候,一直强调多来源、多态的数据,那么刚才董博士介绍,Dashboard的数据的来源有新闻发布的,然后有Twitter上的,有 Excel表格,还有有PDF,然后各种网络上局部的一些数据等等。其实这种多元性和多态性,以及又用通过一个及时收集的形态来呈现出来,基本上把未来10年甚至更久远的大数据,该如何的收集、如何分析做了一个很好的技术展望,我觉得还是非常了不起的,这是一点。
另外一点,这样一个map不仅对于我们今天的控制,更对于未来我们形成一个全球的共识有帮助。因为要想把新冠肺炎这样一个疾病控制起来,全球共识是非常重要的,比如说我们现在是Flatten the curve这样的一个阶段,未来是要把它eliminate,甚至说是极端的想把它eradicate。不同的策略是需要相应的政策支持,那么大家有这样一个共同的平台之后,各个国家的技术人员甚至政府首脑也有一个共同的平台来共同推动,我觉得 map在一个相当长的时间内还是会被大家关注的。
复旦大学罗力教授(1)
我感觉这是一个非常了不起的工作,以前一直也在用约翰霍普金斯疫情地图的数据,然后提一些公共卫生中的建议,分析全球的形势。那么我在董博士的阐述过程当中,我感觉到尤其是让我感觉到特别了不起的一个地方。从一开始一个idea。然后就去做了,慢慢像滚雪球一样的,最后产生世界级的这么一个影响力。
所以我的第一个问题就是我想问一下是怎么看待我们这样从一个idea,然后一直到最后做成一个具有这么如此影响力的这么一个事情?那么这当中你和你的团队,有什么特别的因素,促成了这一切的这块的一个发生和成功?因为据我所知也有很多这个团队也在做的类似的事情,但是最终做成如此影响力的,现在看起来主要是你所在的这么一个团队,所以你能不能谈一下你对JHU COVID Dashboard这么一个个不断发展壮大的过程当中的重要影响因素,或者说它的主要取决的一个这个环节是在什么地方?
董博士回应罗教授(1)
好,谢谢罗教授。我回答一下就是说我们疫情地图为什么能够成功?其实我现在有可能总结起来会说有这几点,但是这些点并不能保证以后再遇到同样的事情,会促使同样的事情或者同样的成功。
我觉得对于我个人来说的话,我觉得多方面的因素,因为像我本人,我自己是从事 GIS就是地理信息系统或者网络开发,从事了大概有五六年的时间,所以说对于整个的技术技术流程我是比较熟悉的,而且我也在ESRI公司正好是dashboard他们做软件的 team去实习过,我对他们最新的技术都是比较容易上手的。其次的话是我的导师,她是研究 infectious disease,就是传染病,流行病这一块的专家,在她的引导下,我觉得我本身也向这个方向去靠拢,所以说当新冠肺炎刚出来的时候,我也就是希望可以通过自己的一些技术,还有一些学术的兴趣来帮助自己的家人和朋友来进行一个发展。之所以后面能成为全世界比较出名或者说头部的一个数据分享平台,我觉得因素还有非常多,比如说像霍普金斯大学,如果我只是一个普通公司的员工,或者是普通其他学校的一些学生去发布,估计影响力也没有这么大,因为我知道有一些听说在西雅图那边有一个高中生,他其实也在做,但是由于他的发布平台并不是像Hopkins这种在医学界是非常有名的一个学校进行发布的,所以说它的平台可能并没有那么出名,但是我们的话依托学校的权威性,所以说在这方面也是有一定的作用的。然后还有学校的一个帮助。我就记得有一件比较有意思的事情,就是学校都关门了,就是学生也不在学校里面上课,但是学校专门给我们小组完了安排了一个会议室,然后我们每天在保持科学的距离的情况下,我们可以进行一些办公。校长有一次还专门过来去看我们的情况到底怎么样。
当然我当时我并不认识校长,我甚至连校长照片都没见过,我觉得以为校长是一个可以说是扫地僧或者说清洁员之类的,我当时只是随便打了个招呼,后面我才知道是校长。但是不管怎么说,可以看到学校他是从上到下,他们都是对我们的项目采用了非常多的关注,还有支持的,还有整个学校的媒体也是从上到下是在就对我们进行一个帮助。很多比如说CNN,还有华尔街日报,他们用我们的数据的时候出现了什么问题,就联系到我们的新闻机构,新闻机构也会第一时间联系我们,所以说整个这样一个良性的循环,还有学校的支持,也促进了我们dashboard的一个口碑的建立。
还有一点是我个人觉得比较重要的是我们后面合作的团队是applied physics lab。如果大家有关注,就是美国每一个学校得到美国联邦经费的一个排名的话,可以看到他们是排名第一的,它比排名第二的lab感要多出来近一倍的资金,这一个lab基本上是承包了美国很多国防或者一些比较高精尖的一些科研的研究,当然大部分都属于保密级别的,但是唯一有关于公共数据的或者公共卫生的这一个部门,他们是保密级别没有那么高,而这样一个部门又有强大的技术,又有政府的相关的一些支持,以及我们Hopkins有直接的联系,这样也促使了我们后面在数据获取方面的一些进步。
复旦大学罗力教授(2)
目前在疫情新安疫情这方面,数据集成方面是取得了非常大的成果,也积累了很多数据,产生巨大的影响。但是新冠疫情终会过去了,随着我们疫苗当中的一个普及, 后面我们一直觉得他最后还是会向普通流感那边靠近。所以我想问一下你下一步的打算是什么?因为你已经拥有了这方面当中的经验和相应的技术。
董博士回应罗教授 (2)
对,我们也收到了很多这方面的一个提问的。最近短期内的打算就是把关于疫苗接种方面的信息融入dashboard,可以向全世界的用户展示。
对于长期的一个计划而言,我们有可能会把我们的网站转换成一个关于 Cronovirus的博物馆或者历史的一个平台,因为它也某种程度上相当于人类的数字的遗产,对于人类以后社会的发展还是有所帮助的,就相当于 John Snow在很早之前关于伦敦的一些疾病研究,它也是采用了一种类似于在地图上面标注每一个疾病发生的地点和水源关系来进行一些研究。我们的地图相当于记录了21世纪一次大规模流行病学传播,所以说针对这方面有可能也会把我们的网站向一个公众历史平台去发展。
BrainCo首席设计师杨首席
我觉得董博士在做一些非常伟大的事情,确实像刚才罗力教授说的。引发我们的思考为什么这个项目会取得如此大的成功,我觉得是董博士靠着极强的self-motivation内驱力,从一个科研的出发,一步步在引起学者专家、媒体记者的注意,然后逐步变成世界最具影响力的新冠疫情地图平台。其实Dashboard作为互联网产品来说也取得了巨大的成功(即点击流量)。我也非常同意董博士刚刚说的,除了可能很多人加入JHU COVID-19 Dashboard团队是带着对抗击新冠疫情工作的热情,但是董博士团队自身的强大内驱力,更会产生强大的正向吸引力,召唤更多的志同道合的人来共事。包括董博士还说自己所在的学校,约翰霍普金斯大学,有很强的业界影响力来支撑项目的推广,我觉得这些都是非常好的。除此之外,我觉得在董博士身上可以看出来一种entrepreneurship,就是一种创业的精神,而且还有就是产品思维的一个能力。
其实刚刚有一点我觉得跟设计和产品体验相关。很多做学术的可能会比较忽略user experience这一方面的东西。可是从刚才的整个汇报来说,其实董博士处处都在考虑这些,他在设身处地的思考、作为一个普通的用户,在这个网站上想得到什么信息,该如何去排布,然后包括在点和面的这样的一个选择上,其实很有可能是潜意识里,最终决定了去做这个点的地图,因为其视觉冲击力。其实除了视觉冲击力之外,我觉得他们做了一件非常正确的一个选择,因为热力图很多时候,对于像一些色盲或者说色弱的一些人来说,会存在一些影响的。所以说用上一些面积的区分,其实对于用户来说也是非常友好的。总之我觉得综合很多因素,最终促进了这件事的一个成功,非常感谢董恩盛团队。然后我有一个小小问题,Dashboard现在主要是现在的确证数据。关于之后的比如说复发率,或者说是关于一个变异率,有没有一些可以去追踪的方式?
董博士回应杨首席
谢谢钊祎姐,我觉得你提这个问题确实非常有意思,就是关于Dashboard加上疾病的复发,还有病毒的变异相关信息,是不是对我们整个人群有帮助?还有之前我们在讨论中的一些关于demographic数据,其实都对我们的疫情发展有非常多的影响。
不过受限于数据公开的水平,每个地方都不一样,我们在这方面很遗憾没有办法获得。当然我们只能通过一些论文或者学术的方式进行呼吁,希望一些政府部门以后可以在数据方面可以更加的公开或者更加透明一些。我突然想再穿插两句,因为您是关于UI/UX的专家,所以说我也想以后有一个进一步的交流。您刚才提到的关于color blind还有heatmap那些东西,确实我们也收到过几个user对我们的一些反馈,确实他们看到红色的点,他们分不清红色和绿色或者红色其他颜色。还有我现在替代我老板每天在维持小组的一些会议和讨论,我有时候感觉自己确实是一个 product manager的角色,就是要通过用户的一些反馈把对产品的需求汇总并及时的向我们组里成员进行传达,然后让他们再进行落实。反正整个一个过程我个人来说是比较enjoy的,希望以后可以带给大家更多的数据,谢谢。
以上就是第二期HalthX Talk的精彩内容,欢迎各位感兴趣的朋友关注我们公众号,了解更多前沿、专业、跨界的医疗科技分享!